张宏江:人工智能的长远发展需要有人坐冷板凳
从金山 CEO 退休两年后,除了在源码资本任职投资合伙人,张宏江又在刚刚成立不久的北京智源人工智能研究院担任首届理事长,致力于推动不同行业分享大数据,让从事基础研究院所和 AI 的创业公司更容易获得数据。
作为一个横跨产学研、投资四界的人,他对 AI 产业发展无疑有着更全面的了解。近期,作为即将召开的 2018 大数据技术大会(http://bdtc2018.hadooper.cn/)的主题演讲嘉宾,他接受了 AI科技大本营的专访,讲述了 AI 产业投资、AI 公司发展和人才培养三方面的内容。
AI科技大本营:从投资角度,你觉得中国在“智能+”领域投资的短板是什么?
张宏江:中国人工智能投资聚焦在应用层,算法、芯片这些基础层的公司与美国相比确实少一些,这跟我们的发展阶段相关,但这会逐渐改善。
AI科技大本营:在应用层,你看好哪些“智能+”领域的发展前景?
张宏江:我不是应用领域的专家,但发展前景一般与这两点有关:一是应用场景能够产生大数据,二是能够产生很多收入或者它本身就有很大的资源,也就是钱多、数据多的行业,比如金融、医疗和移动互联网。
AI科技大本营:钱多、数据多的行业有很大的发展前景,但今年的投融资数据显示,获得最多融资额的是智能制造,这说明了什么?
张宏江:应用场景越大,未来所能够影响的市场越大,显然潜力也就越大。我们谈的所有概念都是相对概念,制造业是中国最大的产业,进一步智能化后显然有最大的市场,所以在这个领域吸引到投资是正常的、比较健康的。
AI科技大本营:去年年初,李开复等业内人士就预言今年年底寒冬来临,AI 泡沫会破掉,不过投融资数据同样显示,相比去年,今年的 AI 投资事件在数量减少了 1/3,但整个投资的融资额度却增加了将近 1/4,AI 投资的热度似乎不降反升了?
张宏江:我们说泡沫破灭还是寒冬来临都是相对概念。换句话说,今天人们看人工智能公司已经不像三年前,钱就会跟着几个从大学出来的博士或者教授,从这一点来说泡沫已经破了。
今天投资额度的增加在于很多钱投到了 B 轮以上的公司,所以(总体投资)数量降低是正常的,这恰恰说明了整个市场趋于成熟,投资也越来越理性,人们对于一家 AI 公司所需要具备的核心竞争力在什么地方也越来越清楚。
另外,关于投资寒冬,其实大家更多看的是经济周期,当经济下行的时候投资一定会变得更加小心。
AI科技大本营:如果对 AI 初创企业的创业者们说一句话,你会说什么?
张宏江:想清楚自己到底要做什么。第一个问题是你覆盖的用户到底有没有这种需求;第二个问题是有这种需求,你和现在已经在满足他们这种需求的公司有什么核心的差异化。
谈 AI 公司:要形成数据生产的闭环
AI科技大本营:你强调 AI 公司的护城河是数据和人才,算法和技术形成不了商业模式,但关键问题是他们如何获得高质量的数据以及正确地使用数据?
张宏江:如何获取高质量的数据这个问题今天已经有非常好的答案,这也是为什么这一波AI浪潮能够起来的根本原因之一。20 年前人们做神经网络的时候,并不是完全不知道算法应该怎么往下延伸,而是说那时候根本就没有这么多数据。但尤其过去 10 年移动互联网的快速发展,人和数据有了大量的深度交互,这本身就是产生高质量标注数据的过程。比如用手机拍一张照片,你至少知道是谁在什么地方、什么时候、用哪个手机照的,这些摄像机参数都有,然后就能很容易做场景识别。
同样的道理,我认为未来的人工智能公司一定是所谓的闭环公司,就是说你有产品,产品跟用户进行交互,这个过程中又产生大量反馈去改善产品以及用户体验,吸引更多用户之后,也就能产生更多数据从而训练更好的算法。整体来说是一个循环,尤其是移动互联网的“环”。
所以我不认为产生高质量大数据是个问题,实际上更大的问题是怎么分享不同行业的大数据,怎么让做基础算法研究的人能够用它训练更好的算法,这是核心问题所在。
AI科技大本营:既然数据起决定性作用,那是不是可以认为未来没有数据的 AI 公司都会死掉?
张宏江:也不能说它会死掉,总归会留下一些AI技术和解决方案 咨询公司,但这些公司很难成为真正的具有领军地位的平台型公司。
AI科技大本营:反过来看,如果现在的大数据公司或者数据平台快速地跟进算法或技术,那他们在未来竞争中应该更有优势。
张宏江:没错,因为今天那些在人工智能上有优势的公司,比如 Google,Facebook,微软,Amazon 的核心在于他们能够获得大量实用场景的数据,当然他们也有很强的技术团队,尤其是 Google 和微软。另外像中国的 BAT、今日头条、美团也一样,他们能够持续获得大量高质量的数据,加上他们本身的技术实力,他们成为人工智能领军企业是毫无疑问的。
AI科技大本营:即将举办的 2018 大数据技术大会(BDTC)的演讲议题至少有一半都与人工智能技术强相关,怎么看大数据会议“AI 化”的趋向?
张宏江:大数据会议持续举办很多年了,甚至没有因为人工智能的热度把名字给改掉,我感到非常高兴。大数据我们谈了 15 年,但它的应用落地很有限,深度学习算法的突破给大数据的应用提供了强有力工具。在智能化之前,企业首先要先做到数据化,要意识到用数据来驱动业务、驱动产业。所以对于大数据的未来发展,我们应该非常乐观地认识到它是这次产业革命最核心的生产资料,而再利用人工智能这种工具,会找到更好、更多的大数据应用场景。
谈 AI 人才:一窝蜂扎堆的方式不可取
AI科技大本营:从技术人员角度,你认为 AI 时代需要的优秀人才都有哪些特征?
张宏江:任何时代业界对技术人员的要求都是同样的,最核心的是热爱技术,有扎实的技术基础,动手能力极强,只是说 AI 时代可能对人才的技能要求更高,人工智能工程师不只是写程序,还要学会不断开发算法,要有很强的数据分析能力、应用场景的理解能力。
AI科技大本营:大学是为企业输送 AI 人才的重要基地,去年以来有一个显著的趋势是至少有 50 家高校的本科都设置了人工智能学院。在人才培养方面你与高校也有交流,你觉得高校培养 AI 人才方面存在哪些误区?
张宏江:任何一窝蜂的做法都不可取,尤其是大学都这样做,却不看具体要求。比如我们 15 年前都做软件学院,今天谁告诉我软件学院跟计算机学院的区别?10 年前大家开始开设电商专业,电商专业到底学的是什么?今天人工智能的兴起让我们对人工智能人才的技能要求更多,那我们本科教育应该去加强人工智能课程的设置和质量,让它成为计算机专业方向的侧重方向。你做人工智能专业修不修计算机基础课?要不要懂计算机系统架构?要不要懂计算机基本算法?你前面还要学数学、代数,这些都要做。
所以我看不出今天一窝蜂做人工智能本科专业对这个产业有任何益处。五年以后,如果需要更多芯片人才、网络人才怎么办?10 年前为什么不设 AI 本科专业?我们需要的恰恰是建立起持之以恒的计算机本科教育,强调计算机基础能力,需要课程内容设置更扎实、丰富,包括教材、讲课的内容要不断跟上技术发展的需求。
AI科技大本营:另一方面,这么多人工智能学院的成立也说明对 AI 人才的需求很旺盛。
张宏江:我没有看到美国排名前 50 的学校一窝蜂地扎堆。过去 30 年人工智能都在坐冷板凳,因为热了再开这个课,那五年以后再坐冷板凳怎么办?我们要的是扎实的本科教育,不是追噱头的一窝蜂。
AI科技大本营:美国的 AI 人才教育有什么值得借鉴的地方?
张宏江:过去几十年我们一直在向美国学习教育(课程)怎么设置,这种过程应该持续下去,但我们经常学到的是外表或者是一些“时髦”的东西,比如今天大学大多强调的是论文、SC 检索。
我前段时间跟一位院士聊天,聊到在学术上中国人工智能的人才数量已经不少。他说量是比以前增加了很多,但你看看他们在做什么?国际人工智能大会上发表的文章数量已经不少,但这些文章据说 90% 都分布在最热的深度神经网络,就跟设置本科人工智能专业的情形一模一样,这是令人忧虑的。
大家有没有想过今天的神经网络或者深度学习缺陷在哪?它不能解决的问题是什么?这些算法未来的演进是什么?是不是应该在 AI 的其他地方再多做点?我们更应该强调持续的基础研究,真正能够坐很长时间冷板凳的东西。
AI科技大本营:你认为目前人们对人工智能行业的发展最需要重视的问题是什么?
张宏江:最大的风险是人们认为人工智能只有深度学习或者只有神经网络学习。我们知道每个算法都有它的局限性,如果只考虑一种算法,也应该更多地看一看这种算法的改善空间,这种算法能不能跟其他算法结合,从而应用到更好的应用场景去创造更大的价值。
今天人工智能取得的突破都是长期坐冷板凳的结果,下一个突破可能也在于今天坐冷板凳的那些人,希望 AI 的基础研究能够放眼更远的未来。
本文为 AI科技大本营原创文章,转载请联系微信 1092722531。
BDTC 2018
◆
精彩纷呈
◆
2018 年12月6-8 日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN、中科天玑数据科技股份有限公司协办的 2018 中国大数据技术大会(BDTC 2018),将在北京新云南皇冠假日酒店隆重举行。
除 Keynote 外,主办方精心策划了 13 场专题技术和行业论坛,涵盖大数据分析与生态系统、深度学习、推荐系统、大数据安全与政策、大数据可视分析、精准医疗大数据、数据科学与大数据技术教育、数据库、金融大数据、知识图谱、工业大数据、区块链、交通与旅游大数据等主题。
点击『阅读原文』,查看大会详情
推荐阅读
“基因编辑婴儿”惹争议,你或许不知道机器学习在脱靶效应中的作用?
免费报名 | 微软亚洲研究院副院长刘铁岩:机器学习技术前沿与未来展望